编者按:本文为悉地网专栏作者投稿,作者罗超。
今年315晚会多家科技公司被点名过堂,骚扰电话、网络贷款、电子烟……搜狗也在315晚会成功登陆央视,不过却有不同角色。
315晚会开播前,搜狗与央视财经频道联合推出的AI主播“姚小松”正式上岗,在央视对3·15晚会进行预热。“姚小松”以央视主持人姚雪松为原型,基于语音合成技术,对其声音、唇语和表情进行模拟,实现了跟真人一样的主播发声和画面呈现。
AI主播的出现是媒体智能化的里程碑,也给AI技术落地创造了黄金场景。
AI主播应用前景广阔
这不是搜狗AI主播第一次公开亮相,去年7月,“姚小松”在香港RISE科技峰会上首次亮相,AI主播这一AI应用模式引发AI和媒体产业关注。
就媒体行业而言,AI主播应用前景广阔。
在碎片化时代,媒体必须满足多元化的新闻消费场景,视频新闻是重要的新闻传播形态,然而受制于制作成本只能支持少部分新闻,特别是非电视媒体。应用AI主播技术后,媒体可以更低成本不间断地生成视频新闻或者语音新闻,提高传播竞争力。
传播视频新闻制作流程长,从新闻脚本到视频录制需要一定的时间,因此有不可避免的滞后性,AI主播直接将文字转化为文字,延时更少,新闻时效性将得到大幅提升,众所周知,时效性、新奇性和重要性是新闻“三性”,时效性排在第一位。
传统主播可能会因为个人原因在实时类新闻节目中出现失误,机器与人相比出错率更低,因为不知疲倦,没有情绪,不会走神等等,AI主播基于AI技术智能生成新闻内容,出错率会大幅降低。
AI主播技术可以生成更多视频新闻,未来还可实现一个新闻快速生成不同语种版本,进而对不同方言/语种用户更加友好,甚至可以生成手语、语音等版本,满足有障碍用户群的新闻获取需求。
可以看到AI主播在媒体产业应用前景广阔,搜狗AI主播在315晚会这一行业瞩目的黄金时段亮相中国核心媒体央视,意义非凡:一方面,这表明主流媒体对AI主播这一技术的积极拥抱态度;另一方面,央视作为新媒体技术应用的佼佼者,对AI主播技术的应用也将吸引更多媒体同行关注,可以认为,搜狗AI主播技术将从此正式走向媒体产业,开启商业化之路,新媒体时代,中国媒体数量十分庞大,AI主播也有望给搜狗贡献规模化收入。
AI主播不会取代人类主播
很多人看到AI主播后,第一个想到的问题是,主播会失业吗?如果机器可以更低成本、更快速度和更低失误地生成视频新闻,为什么还需要人类主播呢?在我看来,短期内“姚雪松”不用担心被“姚小松”们取代。
首先,AI主播技术尚未发展到以假乱真的程度,效果距离真实主播有一定距离。长期来看AI主播的逼真度会越来越接近人类,不过因为不只是语音技术,还涉及到表情、唇形、感情等,要以假乱真难度很大,不断接近也需要算法长时间的进化。
其次,主播不是简单地读新闻,而是带有感情、情绪甚至信念去播报新闻,他们都会根据新闻内容进行不同语调神态风格的播报,机器人很难做到如此个性化,也很难做到人类主播一样感情饱满、收放自如和随机应变。
最后,主播很多时候有象征意义,或者说已经成为一个IP,比如很多国家都有官方新闻主播,我国就有多张“国脸”,很多电视台有自己的金牌主播,观众对主播会产生感情。
AI主播短期内不会取代人类主播,在可见的未来,AI主播将负责常规新闻的播报,AI主播的出现将解放人类主播,让他们从繁琐的常规播报中解放出来专注于重要内容播报,抑或向主持人转型,即AI主播与人类主播会是协作而不是替代关系。
相对于传统新闻播报而言,AI主播的价值将更多体现在新闻播报模式创新上。AI主播不只是可以实现更低成本、更快速度和更低失误的常规新闻播报,也可以改变新闻消费模式,进行各种创新。消费者对新闻主播会有自己的偏好,AI主播技术有望实现个性化的音视频新闻产品,比如对于一些已经退役的主播如赵忠祥,AI主播技术可以生成“替身”永久播放新闻,满足怀旧观众的需求;再比如用户可以选择自己喜欢的某个明星如林志玲作为原型,成为自己看新闻的AI主播——在千人千面的信息流时代,个性化新闻正在成为媒体行业的趋势。
媒体与AI技术正在加速融合,在AI主播外,机器人同传、机器人翻译笔、智能速记、智能写稿、智能内容审核,都在应用AI技术。
搜狗在AI+媒体上已经形成业务矩阵,在AI主播外,两会期间,搜狗智能录音笔C1在采访现场提高媒体采写效率;搜狗同传已成为首个商用AI同传,为500+国内外媒体峰会、科技大会以及体育赛事等提供同传服务。媒体的基础是信息,信息的基础是表达,表达的基础是语言,而基于语言的AI正是搜狗的差异化竞争力,媒体+AI成为搜狗的主场。
分身技术价值不止于AI主播
搜狗已推出多个AI主播,虽然原型不同,但背后技术却是一样的:都是“分身技术”,基于这一技术,只需要输入文字,就可以模拟原型语气语调、面部表情、说话逻辑等智能发音,这是搜狗核心AI技术,其利用搜狗语言AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。
换句话说,分身技术让AI具有了更丰富的表达方式,从文字表达走向音视频的富媒体表达,其不只是可以“克隆”主播,理论上也可以克隆每个人,让其拥有网络替身。
分身技术在智能助理甚至机器人上都大有可为,我们现在使用的智能语音助理都是千篇一律,每个人iPhone里的Siri声音都是一样的,基于分身技术,用户不只是可以定制智能助理的语音,甚至可以看到助理的虚拟面貌,声音和画面原型用户都可以定制,比如选择自己的偶像或者朋友,也可以给自己定制一个分身,通过智能设备去陪伴孩子、宠物或者女朋友。
分身技术是对一个人声音、表情、神态、外貌的模拟,因此理论上就可以实现对一个人的“复活”。乔布斯可以在分身技术加持下回归苹果发布会舞台,杰克逊可以在分身技术下复活现身演唱会与粉丝见面,每个人都可以通过分身技术创造虚拟替身。
分身技术有望改变动画片等以人类为原型的节目的制作方式,基于智能合成技术,真人电影可以智能转化为动画片,大幅降低动画片制作成本。游戏、二次元、直播、短视频等文娱内容产品,也有望应用分身技术来降低成本,实现更多创造可能性,比如用户可以观看分身技术生成的直播节目,或者二次元动画,并与偶像互动。
分身技术的本质是对语言、表情、神态、姿势等人类表达方式的智能化模拟,是人工智能的重要部分,这一技术应用场景将十分广阔,绝不只是媒体主播。除了前面提到的各种应用外,在教育、医疗、客服等行业,可以实现虚拟客服、虚拟老师、虚拟陪护,降低各行各业的人力成本。
本文为专栏作者授权悉地网发表,版权归原作者所有。文章系作者个人观点,不代表悉地网立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。咨询微信客服
0516-6662 4183
立即获取方案或咨询top